在计算和神经科学领域,关于实现学习、记忆、抽象和行为等关键认知功能的基础计算仍有许多未知之处。本文提出了一种学习和记忆的数学和计算模型,该模型基于一小组生物上可行的功能,包括巧合检测、信号调制和奖励/惩罚机制。我们的理论方法提出,这些基本功能足以建立和调制一个可进行计算的信息空间,从而生成可用于推理和行为的信号梯度。用于测试这一点的计算方法是一个结构动态的细胞自动机,具有连续值的细胞状态和一系列在无向图上传播的递归步骤,其中记忆功能完全嵌入在图边的创建和调制中。实验结果表明:玩具模型可以在一次训练运行后做出近乎最优的选择来重新发现奖励状态;它可以避免复杂的惩罚配置;信号调制和网络可塑性可以在稀疏的奖励环境中产生探索性行为;该模型生成与上下文相关的记忆表征;并且由于其最小的单次训练要求以及灵活的上下文记忆表征,它表现出很高的计算效率。
主要关键词
![arXiv:2501.06192v1 [cs.AI] 2024 年 12 月 20 日PDF文件第1页](/bimg/6/6b05605441396ffac75a2286a10f10fd711380c1.webp)
![arXiv:2501.06192v1 [cs.AI] 2024 年 12 月 20 日PDF文件第2页](/bimg/7/73c4306562d2963b4574e8235456b5c67ff3b1d9.webp)
![arXiv:2501.06192v1 [cs.AI] 2024 年 12 月 20 日PDF文件第3页](/bimg/4/482a2b84faa36f129af9ac596d6b76eebf6ca9b9.webp)
![arXiv:2501.06192v1 [cs.AI] 2024 年 12 月 20 日PDF文件第4页](/bimg/1/1dfe6e94cbf53421d0ea649b237a6c3c05159d5d.webp)
![arXiv:2501.06192v1 [cs.AI] 2024 年 12 月 20 日PDF文件第5页](/bimg/3/32cb10bc0d192caa3e5bc282ff9c1f06375f4f3b.webp)
